modelación y prueba de hipótesis
Xalapa, Ver., 29 enero 2024
¿Descriptivo o comparativo?
¿Cómo se miden las variables (escalas)?
¿Cómo se definen los tratamientos?
¿Cómo se asignan los tratamientos a las unidades de observación?
¿Procesos de confusión?
¿Se usó aleatorización en algún punto?
Hacen aparecer una asociación que no existe.
Ocultan o enmascaran la existencia de una asociación
Cuando una variable explicativa y alguna otra variable actúan simultáneamente sobre la de respuesta.
En este caso la variable de respuesta es un “colisionador”.
Si no se maneja adecuadamente en el diseño del estudio o en el análisis, pueden producir resultados sesgados.
La obtención de datos cuantitativos puede realizarse de muchas formas distintas, pero siempre se parte de alguna forma de clasificación.
Aunque clasificar puede parecer una tarea simple, muchas cosas dependen justamente de como se hace.
El tipo más simple de medición es aquel en el que las categorías sólo se etiquetan.
Esta es la denominada escala de medición categórica __ o __ nominal .
A veces resulta útil expresar mediciones continuas en forma nominal.
Estructura general
Ejemplo de modelo lineal
Ganancia de peso en un grupo de orugas que declina conforme se incrementa el contenido de taninos en la dieta.
Esta condición puede describirse en forma abreviada así:
Como modelo lineal se puede escribir así :
Interpretación de términos
las X ’s proporcionan información sobre el nivel del individuo i en los factores que estamos considerando.
Las β son incógnitas que debemos estimar (en eso consiste ajustar el modelo).
La primera incógnita y la variable X 0 que la acompaña típicamente juegan el papel especial de reflejar el efecto de los factores constantes, esto es, los factores que son comunes a todas las unidades experimentales, para esto usualmente X 0 toma simplemente el valor de 1 para todas las unidades experimentales observadas.
Un agrónomo planea estudiar las tasas de producción de cuatro híbridos de trigo en tres regiones geográficas con clima árido, representantes de diferentes condiciones de sequía. Los sitios se escogen según la cantidad de lluvia y la respuesta es el rendimiento por hectárea.
Una forma de modelar datos cualitativos como los indicados en el ejemplo es emplear variables indicadoras o dummy. Todo lo que hay que hacer es definir para cada variable las condiciones bajo las que toma uno de dos valores posible, usualmente 1 o 0. Por ejemplo:
Cuando los valores de una variable pueden expresarse como combinaciones lineales (sumas o restas de múltiplos o submúltiplos) de las otras variables en el conjunto,
se habla de dependencia lineal.
A esto, como ya hemos dicho, se le denomina colinealidad o
Multicolinealidad.
¿ por qué?
\[ y = \mu + \beta_1x_1 + \beta_2x_2 \]
¿Cuál es la dependencia lineal en esta tabla de datos?
¡La colinealidad impide resolver el ajuste de modelos!
Para resolver este problema hay que reparametrizar.
Un ecólogo desea probar los efectos relativos de 8 tratamientos (“Xs”) sobre la sobrevivencia de plántulas de Phaseolus vulgaris . Supongamos que se cuenta con 64 plántulas relativamente homogéneas. ¿qué solución proponen?
…se enteran que las 64 plántulas provienen en lotes de 8 de distintas cámaras y sustratos de germinación.
¿modificaría esto el diseño y al (los) modelo(s) asociado(s)?